Tính năng thiết kế MCM
AMD đã cung cấp thêm thông tin về dòng GPU Instinct MI200 sử dụng kiến trúc CDNA 2 Aldebaran, đây là dòng sản phẩm đầu tiên có thiết kế MCM. Các kiến trúc sư của AMD, Alan Smith và Norman James, đã trình bày về GPU Instinct MI200 tại hội nghị Hot Chips 34. AMD là công ty đầu tiên áp dụng công nghệ MCM với sản phẩm lớn là Instinct MI200 mang tên mã Aldebaran.
GPU AMD Aldebaran sẽ có nhiều kích thước khác nhau nhưng tất cả đều dựa trên kiến trúc CDNA 2 hoàn toàn mới, là phiên bản tinh chỉnh nhất của Vega. Một số tính năng chính bao gồm kiến trúc CDNA 2 – nhân ma trận thế hệ 2, tăng tốc các phép toán ma trận FP64 và FP32, mang lại hiệu suất FP64 lý thuyết cao gấp 4 lần so với các GPU thế hệ trước của AMD.
Công nghệ đóng gói lãnh đạo – Thiết kế GPU đa die đầu tiên trong ngành với công nghệ EFB (Elevated Fanout Bridge) 2.5D cung cấp 1.8 lần số lõi và 2.7 lần băng thông bộ nhớ cao hơn so với các GPU thế hệ trước của AMD, đạt băng thông bộ nhớ lý thuyết tối đa 3.2 terabyte mỗi giây. Công nghệ AMD Infinity Fabric thế hệ thứ 3 – Tối đa 8 liên kết Infinity Fabric kết nối AMD Instinct MI200 với CPU EPYC thế hệ 3 và các GPU khác trong cùng một nút, cho phép đồng bộ bộ nhớ CPUGPU và tối đa hóa hiệu suất hệ thống, giúp việc sử dụng mã CPU dễ dàng hơn khi khai thác sức mạnh của các bộ tăng tốc.
GPU Aldebaran trong AMD Instinct MI200 bao gồm hai die: một chính và một phụ, với tổng cộng 16 Shader Engines (SE), mỗi die có 8 SE. Mỗi Shader Engine có 14 Compute Units (CUs) hỗ trợ FP64, FP32 và 2nd Generation Matrix Engine cho các phép toán FP16 và BF16. GPU này được sản xuất trên quy trình 6nm của TSMC và có tổng cộng 58 tỷ transistor.
Sơ đồ khối GPU AMD Instinct MI200 cho thấy mỗi die gồm 112 đơn vị tính toán (compute units) hay 7,168 bộ xử lý luồng (stream processors). Tổng cộng, chip này có 224 đơn vị tính toán và 14,336 bộ xử lý luồng. GPU Aldebaran sử dụng giao tiếp XGMI mới. Mỗi chiplet có một động cơ VCN 2.6 và bộ điều khiển IO chính. Mỗi chiplet GPU có bốn bộ điều khiển bộ nhớ 1024-bit cho bộ nhớ HBM2e.
Mỗi chiplet GPU có tổng cộng 8 MB bộ nhớ L2, được chia thành 32 phần. Mỗi phần cung cấp 128BCLK với khả năng xếp hàng và phân xử tốt hơn, cùng với các thao tác nguyên tử nâng cao. Hệ thống bộ nhớ cho mỗi GCD bao gồm 64 GB bộ nhớ HBM2e, với tổng băng thông 1.6 TBs cho mỗi GCD, được chia thành 32 kênh với 64BCLK để tối ưu hóa điện áp hoạt động.
📢 Liên hệ quảng cáo: 0919 852 204
Quảng cáo của bạn sẽ xuất hiện trên mọi trang!
Kết nối trong gói bao gồm băng thông hai chiều 400 GB/s giữa hai GCD. Có tổng cộng 8 kết nối Infinity Fabric, trong đó mỗi GPU có thể sử dụng một kết nối cho PCI-Express. Kết nối này có tốc độ truyền dữ liệu đồng nhất giữa CPU và GPU là 144 GB/s. Bạn có thể mở rộng lên tới 500 GB/s bằng cách sử dụng liên kết Infinity Fabric bên ngoài với bốn GPU MI200 series, hoặc mở rộng bằng PCIe Gen 4 ESM AIC với băng thông 100 GB/s.
Hiệu suất của GPU AMD Instinct MI200 Aldebaran cho thấy AMD đã đạt được nhiều kỷ lục trong lĩnh vực HPC so với giải pháp A100 của NVIDIA, với cải tiến hiệu suất lên tới 3 lần trong AMG. Về DRAM, AMD sử dụng giao diện 8 kênh với băng thông 8192-bit, hỗ trợ các mô-đun HBM2e DRAM 2GB. Mỗi stack có thể chứa tối đa 16 GB HBM2e, và tổng cộng có 8 stack, mang lại dung lượng lên đến 128 GB.
Điều đó có nghĩa là nó có thêm 48 GB so với A100, với 80 GB bộ nhớ HBM2e. Tốc độ bộ nhớ đạt 3.2 Gbps, mang lại băng thông 3.2 TBs, cao hơn 1.2 TBs so với A100 80 GB chỉ có 2 TBs. Hai GPU AMD Instinct MI200 CDNA 2 Aldebaran đang vận hành siêu máy tính nhanh nhất thế giới, Frontier, cũng là máy tính Exascale đầu tiên.
AMD đã giới thiệu dòng sản phẩm APU Instinct MI300 với hiệu suất tính toán đạt 1 ExaFLOPs, đứng đầu trong danh sách TOP500 và Green500. Dòng sản phẩm này sẽ tận dụng kiến trúc chiplet để nâng cao hiệu suất. Dưới đây là thông tin về các bộ tăng tốc AMD Radeon Instinct:
- Tên bộ tăng tốc: AMD Instinct MI400, MI350X, MI300X, MI300A, MI250X, MI250, MI210, MI100, MI60, MI50, MI25, MI8, MI6.
- Kiến trúc CPU: Zen 5 (MI400), Zen 4 (các mẫu khác).
- Kiến trúc GPU: CDNA 4, CDNA 3, CDNA 2, CDNA 1, Vega 20, Vega 10, Polaris 10.
- Quy trình sản xuất GPU: Từ 4nm đến 28nm.
- Số lõi GPU và tốc độ xung nhịp: Các thông số khác nhau tùy theo từng mẫu, với tốc độ xung nhịp lên đến 2100 MHz và số lõi GPU lên tới 19,456.
Dòng sản phẩm này hứa hẹn sẽ mang lại hiệu suất tính toán ấn tượng cho các ứng dụng siêu máy tính và AI.
3 TOPS NA FP16 Tính toán TBD 1.3 P
Nguồn: wccftech.com/amd-provides-first-look-at-aldebaran-cdna-2-instinct-mi200-series-mcm-gpu-block-diagram/